Смена парадигмы
Мы переходим от "производительность во что бы то ни стало" к мышлению, направленному на ответственный ИИ (RAI) рамки. В этот новый период технический успех строго зависит от этической устойчивости и мер безопасности.
1. Ограничение оптимизации
Исторически целью было минимизация функции потерь $L(\theta)$. Новая парадигма рассматривает ИИ как задачу ограниченной оптимизации: $$\max P \text{ при условии } C_1, C_2, \dots, C_n$$ где $C$ представляет собой непререкаемые пороговые значения по безопасности и справедливости.
2. Разрыв между «в пробирке» и «в живом организме»
Модели часто достигают передовых результатов (SOTA) на статических тестах (в пробирке), но демонстрируют катастрофические сбои в реальных социально-технических средах (в живом организме) из-за непредвиденных взаимодействий.
Слева: высокая точность/скорость, нулевая безопасность/прозрачность. Справа: сбалансированный шестиугольник, представляющий безопасность, справедливость и интерпретируемость.
Пример: высокочастотная торговля
Модель, ориентированная исключительно на производительность, считается успешной, если она максимизирует доходность. Модель ответственного ИИ — неудачна, если она достигает высокой доходности, но вызывает "быстрый обвал" из-за отсутствия мер стабильности рынка.